<?php
error_reporting(E_ALL ^ E_NOTICE);
ini_set('memory_limit', '1000M');
set_time_limit(0);

/**
 *
 * hadoop处理第三步：DMHezu房源合并
 * input：gov表数据，格式：json(所有数据数组形式json)
 * output：小区id，其他json格式数据
 * 	mapper_step1.php
 * 		input:gov表数据，格式json(所有数据数组的格式)
 * 		handle:相同经纪公司基准数据，经纪公司、小区、室、面积、价格、
 * 		output:按照小区id进行排序的数据，数据格式borough_id\tjson(所有数据数组的格式)
 *
 * @by: lily
 * @created: 2016-05-12
 */

while (($line_json = fgets(STDIN)) !== false) {
    
    $line_json = trim($line_json);
    if (empty($line_json))
        continue;
    /**
     * id,house_title,house_price,cityarea_id,cityarea2_id,house_floor, 6
     * house_topfloor,house_toward,house_room,house_hall,house_toilet, 5
     * house_kitchen,owner_name,owner_phone,source,source_url, 5
     * house_totalarea,borough_id,borough_name 3
     */
    $line = json_decode($line_json, true);
    if (is_array($line) && ! empty($line['source_url'])) {
        echo $line['borough_id'] . "\t" . $line_json . "\n";
        continue;
    }
}
 
